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1 ATTGCGGGGCTTACTGCGCTGATGGGTTCTGCGTTTTATTACCTCTTCGTTGTTTATTTA 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 

27 91990 ATTGCGGGGCTTACTGCGCTGATGGGTTCTGCGTTTTATTACCTCTTCGTTGTTTATTTA 27 9204 9 



61 



120 



GGCCCCGTCTCTGCCGCTGCGATTGCTGCAACAGCAGTTGGTTTCACTGGTGGTTTGCTT 
I I I i I I ! I I I I I I I I I I I I I I I I I I I E i I i I I I I I I I I I I I I I I I I I I 1 I I 

27 92050 GGCCCCGTCTCTGCCGCTGCGATTGCTGCAACAGCAGTTGGTTTCACTGGTGGTTTGCTT 27 92109 

121 GCCCGTCGATTCTTGATTCCACCGTTGATTGTGGCGATTGCCGGCATCACACCAATGCTT 180 
I I I I I i I t I I I i I I I I I I I I I I I I I I ) I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 

27 92110 GCCCGTCGATTCTTGATTCCACCGTTGATTGTGGCGATTGCCGGCATCACACCAATGCTT 2792169 

181 CCAGGTCTAGCAATTTACCGCGGAATGTACGCCACCCTGAATGATCAAACACTCATGGGT 24 0 
I I I I I I I I I I I I ! I I I I I I I I I I I I I I I j I I I I I I I I I I 1 I 1 I I I j II I I I I I I I I M I I 

27 92170 CCAGGTCTAGCAATTTACCGCGGAATGTACGCCACCCTGAATGATCAAACACTCATGGGT 27 92229 

24 1 TTCACCAACATTGCGGTTGCTTTAGCCACTGCTTCATCACTTGCCGCTGGCGTGGTTTTG 300 
I I I I I II I I I I I I I I I I I I I I I I 1 I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

27 92230 TTCACCAACATTGCGGTTGCTTTAGCCACTGCTTCATCACTTGCCGCTGGCGTGGTTTTG 2792289 

301 GGTGAGTGGATTGCCCGCAGGCTACGTCGTCCACCACGCTTCAACCCATACCGTGCATTT 3 60 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I i I I I I I I i I I I I I I I I I I I I I I I I I I I 

27 922 90 GGTGAGTGGATTGCCCGCAGGCTACGTCGTCCACCACGCTTCAACCCATACCGTGCATTT 27 9234 9 

3 61 ACCAAGGCGAATGAGTTCTCCTTCCAGGAGGAAGCTGAGCAGAATCAGCGCCGGCAGAGA 4 20 

1 1 1 1 1 1 i 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t-i 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

27 92350 ACCAAGGCGAATGAGTTCTCCTTCCAGGAGGAAGCTGAGCAGAATCAGCGCCGGCAGAGA 27 924 09 

4 21 AAACGTCCAAAGACTAATCAGAGATTCGGTAATAAAAGGTAAAAATCAACCTGCTTAGGC 4 80 

I I 1 .1 I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ■ 

27 92410 AAACGTCCAAAGACTAATCAGAGATTCGGTAATAAAAGGTAAAAATCAACCTGCTTAGGC 27924 69 

4 81 GTCTTTCGCTTAAATAGCGTAGAATATCGGGTCGATCGCTTTTAAACACTCAGGAGGATC 5 4 0 
I I i I I I I M I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I i I I I I I 
27 924 70 GTCTTTCGCTTAAATAGCGT AGAATATCGGGTCGATCGCTTTTAAACACTCAGGAGGATC 27 92529 

541 CTTGCCGGCCAAAATCACGGACACTCGTCCCACCCCAGAATCCCTTCACGCTGTTGAAGA 600 

I 1 1 1 1 1 1 1 1 1 I 1 1 I I 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 1 1 I I I I I I i I I I 1 1 I 1 1 I 

27 92530 CTTGCCGGCCAAAATCACGGACACTCGTCCCACCCCAGAATCCCTTCACGCTGTTGAAGA 27 9258 9 



601 



660 



GGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTATTCTAAGGACTTCTTCGACGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

27 925 90 GGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTATTCTAAGGACTTCTTCGACGG 27 92 64 9 



Qy 661 CGTCACTTTGATGTGCATGCTCGGCGTTGAACCTCAGGGCCTGCGTTACACCAAGGTCGC 7 20 

I I I I I I I I I I I I I I I j I 1 I I I I I I I II I I I I I I I I I I I I I I I I t I I I I I I I I I 1 I I I I I I 
Db 27 92650 CGTCACTTTGATGTGCATGCTCGGCGTTGAACCTCAGGGCCTGCGTTACACCAAGGTCGC 27 92709 

Qy 721 TTCTGAACACGAGGAAGCTCAGCCAAAGAAGGCTACAAAGCGGACTCGTAAGGCACCAGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I 
Db 27 92710 TTCTGAACACGAGGAAGCTCAGCCAAAGAAGGCTACAAAGCGGACTCGTAAGGCACCAGC 27 927 69 

Qy 781 TAAGAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCACTAAGAAAACTACTAAAAAGAC 84 0 

I I II I II I I I I I I i I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 927 70 TAAGAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCACTAAGAAAACTACTAAAAAGAC 27 9282 9 

Qy 841 CAC C GCAAAGAAGACC ACAAAGAAG T C T T AAGCCG GAT CT TAT AT GG AT GAT T CC AAT AG 900 

II I I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 

Db 27 92830 CACCGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGATCTTATATGGATGATTCCAATAG 2792889 

Qy 901 CTTTGTAGTTGTTGCTAACCGTCTGCCA.GTGGATATGACTGTCCACCCAGATGGTAGCTA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I 1 I t I I I I I 
Db . 27 928 90 CTTTGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGACTGTCCACCCAGATGGTAGCTA 27 92 94 9 

Qy 961 TAGCATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACA 1020 

I 1 1 i 1 1 1 1 I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 1 I 1 1 1 1 1 i I 1 1 I 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 I 

Db 27 92950 TAGCATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACA 27 93009 

Qy 1021 TCGTGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAAC 1080 

1 I I i I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II ! I I I I I I I I I I 

Db 27 93010 TCGTGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAAC 27 93069 

Qy 1081 AGATACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTA 114 0 

I I I I 1 1 t I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I 1 I I ! I I I I I I I I I I j I I i I I I I 

Db 27 93070 AGATACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTA 2793129 

Qy 1141 CGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCCACGATCTGATTGTTACTCCGGT 1200 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 i 1 1 1 1 1 i I i l 1 1 1 1 1 ! I i l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 27 93130 CGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCCACGATCTGATTGTTACTCCGGT 27 93189 

Qy 1201 GTACAACACCGATTGGTGGCATGCGTTTCGGGAGGTAAACCTCAAGTTCGCTGAAGCCGT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I M I i I I I I I I I I i I I I I I 
Db 27 93190 GTACAACACCGATTGGTGGCATGCGTTTCGGGAGGTAAACCTCAAGTTCGCTGAAGCCGT 27 9324 9 

Qy 12 61 GAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTAT CAGCTGTTGCTGGT 1320 

... I I I t I I I I I I I I 1-1 I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 27 932.50 'GAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTATCAGCTGTTGCTGGT 27 93309 

Qy 1321- TCCTGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCC 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I i I I I I I I I I I I 
Db 27 93310 TCCTGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCC 27 93369 

Qy 1381 CTTCCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGCGTGAAGAGATTGTTCGAGGCAT 14 4 0 

I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I | | | | M | | | 
Db 2793370 CTTCCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGCGTGAAGAGATTGTTCGAGGCAT 2793429 

Qy 14 41 GCTGGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAAACGCAGAAAACTTCCTTGCGTT 1500 
I I I I I I I I I I I I I I I I I I I I I ( I I I I i I II I I I I I I I I I I I I I I I 

Db 27 934 30 GCTGGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAAACGCAGAAAACTTCCTTGCGTT 27934 89 

Qy 1501 AACCCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGGGTCAGCCGGACACCTTGCAGGT 15 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27934 90 ■AACCCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGGGTCAGCCGGACACCTTGCAGGT 27 93549 

Qy 1561 CAGTGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATGTTGAAACCGCTGACGGAAGGCG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I II I I I I I I 
Db 27 93550 CAGTGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATGTTGAAACCGCTGACGGAAGGCG 2793609 

Qy 1621 AGTTAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTGAAATGTTTGGGGAGGCGTCGAA 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I | I | I | I 

Db 27 93610 AGTTAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTGAAATGTTTGGGGAGGCGTCGAA 27 93669 

Qy 1681 AAGCGCCGTTCTTGATCTTTTAAAAACGCTCGACGAGCCGGAAACCGTATTCCTGGGCGT 174 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2793670 AAGCGCCGTTCTTGATCTTTTAAAAACGCTCGACGAGCCGGAAACCGTATTCCTGGGCGT 27 93729 

Qy 17 41 TGACCGACTGGACTACACCAAGGGCATTTTGCAGCGCCTGCTTGCGTTTGAGGAACTGCT 1800 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I II I I I I f I I I I I I I i I I I I 

Db 27 93730 TGACCGACTGGACTACACCAAGGGCATTTTGCAGCGCCTGCTTGCGTTTGAGGAACTGCT 27 93789 

Qy 1801 GGAATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGCTGCAGGTCGCGACGCCTTCGCG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I Ml 1 I I I I I I I || | | I I 

Db 27 937 90 GGAATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGCTGCAGGTCGCGACGCCTTCGCG 27 9384 9 



Qy 18 61 TGAGCGCATTGATCACTATCGTGTGTCGCGTTCGCAGGTCGAGGAAGCCGTCGGCCGTAT 192 0 

I I I I I I I I I I 1 I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

Db 27 93850 TGAGCGCATTGATCACTATCGTGTGTCGCGTTCGCAGGTCGAGGAAGCCGTCGGCCGTAT 27 93909 

Qy 1921 CAATGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGCATTATCTACACAGGTCATTGAG 1980 

I I I I I I I I I I I I I I I I I I I I I I I ! I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I [ I I I 
Db 27 93910 CAATGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGCATTATCTACACAGGTCATTGAG 27 93969 

Qy 1981 CAAAAATGATCTCCAGGTGCTGTATACCGCAGCCGATGTCATGCTGGTTACGCCTTTTAA 204 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 27 93970 CAAAAATGAT CTCCAGGTGCT GTATACCGCAGCCGAT GTCATGCT GGT TACGCCT TT TAA 27 94029 

Qy 2041 AGACGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCAACCACCGCGACGGCACTGGTGC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2794030 AGACGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCAACCACCGCGACGGCACTGGTGC 27 94089 

Qy 2101 TTTGGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGCTGACCGGTGCGTATTTATGCAA 2160 

I I I I I I I I I I I I I I I I i I I I I I t I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I 
Db 2794090 TTTGGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGCTGACCGGTGCGTATTTATGCAA 279414 9 

Qy 2161 CCCATTTGATGTGGAATCCATCAAACGGCAAATGGTGGCAGCTGTCCATGATTTGAAGCA 2220 

I I I I M I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I 

Db 2794150 C C CAT T T G AT GT GGAAT C C ATC AAACGGC AAAT G GTGGC AGC T GT CC AT GAT T T GAAGC A 27 94209 

Qy 2221 CAATCCGGAATCTGCGGCAACGCGAATGAAAACGAACAGCGAGCAGGTCTATACCCACGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 2794210 CAATCCGGAATCTGCGGCAACGCGAATGAAAACGAACAGCGAGCAGGTCTATACCCACGA 27 94269 

Qy 2281 CGTCAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGGCACAGTCGGGAGAAAACTCATG 234 0 

I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2794270 CGTCAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGGCACAGTCGGGAGAAAACTCATG 27 94329 

Qy 2341 AACCGCGCACGAATCGCGACCATAGGCGTTCTTCCGCTTGCTTTACTGCTGGCGTCCTGT 24 00 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 27 94 330 AACCGCGCACGAATCGCGACCATAGGCGTTCTTCCGCTTGCTTTACTGCTGGCGTCCTGT 27 94389 

Qy 24 01 GGTTCAGACACCGTGGAAATGACAGATTCCACCTGGTTGGTGACCAATATTTACACCGAT 24 60 

I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. 
Db 2794390 G GT T C AGACAC C GT GGAAAT GACAGAT T C C AC CT GGT T GGTGACCAAT AT TT ACACC GAT 27944 4 9 

Qy 24 61 CCAGATGAGTCGAATTCGATCAGTAATCTTGTCATTTCCCAGCCCAGCTTAGATTTTGGC 2520 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 r 1 1 

Db 27 94 4 50 CCAGATGAGTCGAATTCGATCAGTAATCTTGTCATTTCCCAGCCCAGCTTAGATTTTGGC 27 94 509 

Qy 2521 AATTCTTCCCTGTCTGGTTTCACTGGCTGTGTGCCTTTTACGGGGCGTGCGGAATTCTTC 2580 

I I I I I I M N I I I I | I || | | || I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 

Db 2794510 AATTCTTCCCTGTCTGGTTTCACTGGCTGTGTGCCTTTTACGGGGCGTGCGGAATTCTTC 27 94569 

Qy 2581 CAAAATGGTGAGCAAAGCTCTGTTCTGGATGCCGATTATGTGACCTTGTCTTCCCTGGAT 264 0 

I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2794570 CAAAATGGTGAGCAAAGCTCTGTTCTGGATGCCGATTATGTGACCTTGTCTTCCCTGGAT 27 94 629 

Qy 2641 TTCGATAAACTTCCCGATGATTGCCAAGGACAAGAACTCAAAGTTCATAACGAGCTGGTT 2700 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 94 630 TTCGATAAACTTCCCGATGATTGCCAAGGACAAGAACTCAAAGTTCATAACGAGCTGGTT 27 94 68 9 

Qy 27 01 GATCTTCTGCCTGGTTCTTTTGAAATCTCCAGGACTTCTGGTTCAGAAATCTTGCTGACT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2794 690 GATCTTCTGCCTGGTTCTTTTGAAATCTCCAGGACTTCTGGTTCAGAAATCTTGCTGACT 27 9474 9 

Qy 27 61 AGCGATGTCGATGAACTCGATCGGCCAGCAATCCGCTTGGTGTCCTGGATCGCGCCGACA 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2794750 AGCGATGTCGATGAACTCGATCGGCCAGCAATCCGCTTGGTGTCCTGGATCGCGCCGACA 27 94 8 09 

Qy 28 21 TCTTAAGGTGCCAGGGCTTTAAAGTGCCAGGGGTTCTGTGGGATCCGTACACTGGTTCCC 2880 

I I I I i I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I 

Db 2794810 TCTTAAGGTGCCAGGGCTTTAAAGTGCCAGGGGTTCTGTGGGATCCGTACACTGGTTCCC 27 94869 

Qy 2881 ATGACTTTGACTATTGAGGAAATCGCCAAGACCAAAAAGCTTTTGGTTGTGTCCGATTTT 294 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 27 94 87 0 ATGACTTTGACTATTGAGGAAATCGCCAAGACCAAAAAGCTTTTGGTTGTGTCCGATTTT 2 7 94929 

Qy 2941 GATGGAACCATCGCAGGATTTAGCAAGGACGCTTACAACGTTCCTATCAACCAGAAATCC 3000 

I I 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

Db 2794930 GATGGAACCATCGCAGGATTTAGCAAGGACGCTTACAACGTTCCTATCAACCAGAAATCC 2794989 

Qy 3001 CTCAAGGCGG 3010 

I I I I I I I I I I 

Db 2794 990 CTCAAGGCGG 27 94 999 
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CAGAATCAGCGCCGGCAGAGAAAACGTCCAAAGACTAATCAGAGATTCGGTAATAAAAGG 4 59 

I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I i I II I I I I I I I ! I ! I 

CAGAATCAGCGCCGGCAGAG- AAACGT C CAAAGACT AAT CAGAGAT TCGGT AT — AAAGG 58 

TAAAAATCAACCTGCTTAGGCGTCTTTCGCTTAAATAGCGTAGAATATCGGGTCGATCGC 519 
I | I I I I I I I I I I M I I I I I ! I I I I I I i I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAAAAATCAACCTGCTTAGGCGTCTTTCGCTTAAATAGCGTAGAATATCGGGTCGATCGC 118 

T T TT AAACACTCAGGAGGAT CCT TGCCGGCCAAAATCACGGACACTCGTCC CACCCC AGA 57 9 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I i I M I II 

TTTTAAACACTCAGGAGGATCCTTGCCGGCCAAAATCACGGACACTCGTCCCACCCCAGA 17 8 

ATCCCTTCACGCTGTTGAAGAGGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTA 639 

I I I I I I II I I I I I I I I i I I I I I I I I I i I I I i I I I I I ! I I I i I I I I I I I I 1 I I I I I I I I I I 

ATCCCTTCACGCTGTTGAAGAGGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTA 2 38 

TTCTAAGGACTTCTTCGACGGCGTCACTTTGATGTGCATGCTCGGCGTTGAACCTCAGGG 699 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I t I I I I I 1 I I I ! I I I I I I I I I! I I I I I 
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Db 


179 


Qy 


640 


Db 


239 


Qy 


700 


Db 


299 


Qy 


760 


Db 


359 


Qy 


819 


Db 


419 


Qy 


879 


Db 


479 


Qy 


939 


Db 


539 


Qy 


999 


Db 


599 


Qy 


1059 


Db 


659 


Qy 


1119 


Db 


719 



CCTGCGTTACACCAAGGTCGCTTCTGAACACGAGGAAGCTCAGCCAAAGAAGGCTACAAA 7 59 
I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I S I I 1 I I I I I I I I I I I I I I I 



GCGGACTCGTAAGGC-ACCAGCTAAGAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCA 818 

I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I M I 

GCGGACTCGTAAGGCTACCAGCTAAGAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCA 418 

CTAAGAAAACTACTAAAAAGACCACCGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGAT 87 8 

I | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTAAGAAAACTACTAAAAAGACCACCGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGAT 4 7 8 

CTTATATGGATGATTCCAATAGCTTTGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGA 938 
I | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



CTGTCCACCCAGATGGTAGCTATAGCATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGC 998 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I ! I I I 1 I I I II I I I I I I I I 



TTTCCCCCGTTCTGGAACAACATCGTGGATGTTGGGTCGGATGGCCTGGAACTGTAGATG 1058 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I.I I I I I I I I I I I I I I I I I I I I I I 



TTGCACCCGAACCATTTCGAACAGATACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTG 1118 
I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

TTGCACCCGAACCATTTCGAACAGATACGGGTGTTTTGCTGCACCCTGTT GTCCTCACTG 718 

CAAGTGACTATGAAGGCTTCTACGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCC 117 8 
I I I I I I I I I I ! I II I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I i I I I I I I I I 1 I 

CAAGTGACTATGAAGGCTTCTACGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCC 7 7 8 



Qy 117 9 ACGATCTGATTGTTACTCCGGTGTACAACACCGATTGGTGGCATGCGTTTCGGGAGGTAA 1238 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 
Db 77 9 ACGATCTGATTGTTACTCCGGTGTACAACACCGATTGGTGGCATGCGTTTCGGGAAGTAA 838 

Qy 1239 ACCTCAAGTTCGCTGAAGCCGTGAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGC 1298 

I I I 1 I I I I I I I M I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 839 ACCTCAAGTTCGCTGAAGCCGTGAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGC 8 98 

Qy 1299 AGGACTATCAGCTGTTGCTGGTTCCTGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGA 1358 

llllllllllllllllllllllllllllilllllllllllllllllll I I I I I I I I I! I 
Db 8 99 AGGACTATCAGCTGTTGCTGGTTCCTGGCATTTTGCGCCAGATGCGCCTTGATTTGAAGA 958 

Qy 1359 TCGGTTTCTTCCTCCACATTCCCTTCCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGC 1418 

I I I ! I ! I I I I I I I I I I ! I I i I I I I I ! I I I I I 1 ! I I I I I I I I I I I ! I I I I I I I I I I I I 1 I I 
Db 959 TCGGTTTCTTCCTCCACATTCCCTTCCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGC 1018 

Qy 1419 GTGAAGAGATTGTTCGAGGCATGCTGGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAA 1478 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I II I I ! I I 
Db 1019 GTGAAGAGATTGTTCGAGGCATGCTGGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAA 107 8 

Qy 14 7 9 ACGCAGAAAACTTCCTTGCGTTAACCCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGG 1538 

I M M M I I I I I II M I I M II I M M I I I I I I I I I I I I I M I II M M I I II M I M I I 
Db 107 9 ACGCAGAAAACTTCCTTGCGTTAACCCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGG 1138 

Qy 1539 GTCAGCCGGACACCTTGCAGGTCAGTGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATG 1598 

I I I I I I II I I I M I M I I I I I M M I I I I I I ! I I I I I I I I I I I I I I I I I! I I I I I I I I I I 

Db 113 9 GTCAGCCGGACACCTTGCAGGTCAGTGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATG 1198 

Qy 1599 TTGAAACCGCTGACGGAAGGCGAGTTAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTG 1658 

I I I I I I I i I I M II I I I I I I I I I M I I I I I I I M I I I I M I I I II M M M I I I I I I I II 

Db 1199 TTGAAACCGCTGACGGAAGGCGAGTTAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTG 1258 

Qy 1659 AAATGTTTGGGGAGGCGTCGAAAAGCGCCGTTCTTGATCTTTTAAAAACGCTCGACGAGC 1718 

M I I I I I M I II M I I I I I I I I M M I I I I I M I I I ! I M I M I I I I M M I I II I I M I 
Db 1259 AAATGTTTGGGGAGGCGTCGAAAAGCGCCGTTCTTGATCTTTTAAAAACGCTCGACGAGC 1318 

Qy 1719 CGGAAACCGTATTCCTGGGCGTTGACCGACTGGACTACACCAAGGGCATTTTGCAGCGCC 177 8 

II M I II I I I I I I II II I I I I I II I II I I I I I I II I I I I I I I I I I I II I I I I I II 

Db 1319 CGGAAACCGTAT TCCTGGGCGTTGACCGACTGGACTACACCAAGGGCATTTTGCAGCGCC 137 8 

Qy 17 7 9 TGCTTGCGTTTGAGGAACTGCTGGAATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGC 1838 

I I I I I II I I I I M II M I I I I M M I I I I I I II I I I I ! I I M 1 I I I I I I I I I I I II II M 
Db 137 9 TGCTTGCGTTTGAGGAACTGCTGGAATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGC 1438 

Qy 1839 TGCAGGTCGCGACGCCTTCGCGTGAGCGCATTGATCACTATCGTGTGTCGCGTTCGCAGG 1898 

I I I I I II I I I II I I I I M I I I I I II I I I I I I I I I i I I I I I I I I II I I I I I I M I I I II M 
Db 14 39 TGCAGGTCGCGACGCCTTCGCGTGAGCGCATTGATCACTATCGTGTGTCGCGTTCGCAGG 14 98 

Qy 18 99 TCGAGGAAGCCGTCGGCCGTATCAATGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGC 1958 

M I I I I I I i I I I I ! I I I I I I I II I I II I I I I I I I I I I I I ! II I II I I I I II M I I I II M 
Db 14 99 TCGAGGAAGCCGTCGGCCGTATCAATGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGC 1558 

Qy 1959 ATTATCTACACAGGTCATTGAGCAAAAATGATCTCCAGGTGCTGTATACCGCAGCCGATG 2018 

I I I M I I I II II M I I M M I I I I I I I I II I I I I I I M I II I I II I I I I I I I I I I I I I I I 

Db 1559 ATTATCTACACAGGTCATTGAGCAAAAATGATCTCCAGGTGCTGTATACCGCAGCCGATG 1618 

Qy 2019 TCATGCTGGTTACGCCTTTTAAAGACGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCA 207 8 

I I I M II I I I II I If II I II I! 1 I I II I I I I II I I I I I I I M ! I M II I I I I I II 

Db 1619 TCATGCTGGTTACGCCTTTTAAAGACGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCA 167 8 

Qy 207 9 ACCACCGCGACGGCACTGGTGCTTTGGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGC 2138 
M I I I M I I I M I I I I M I I I I I II II I I I II I II I I I II I II I II I I I I I II I I 

Db 167 9 ACCACCGCGACGGCACTGGTGCTTTGGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGC 1738 

Qy 2139 TGACCGGTGCGTATTTATGCAACCCATTTGATGTGGAATCCATCAAACGGCAAATGGTGG 2198 

I M I I I I I M II I II I I I I I I II II I I I I I I M I I I I I II I I I I I I ( I I I I II I i I II M 

Db 17 39 TGACCGGTGCGTATTTATGCAACCCATTTGATGTGGAATCCATCAAACGGCAAATGGTGG 17 98 

Qy 2199 CAGCTGTCCATGATTTGAAGCACAATCCGGAATCTGCGGCAACGCGAATGAAAACGAACA 2258 

M I I I M I I I II I I I I I I I I I I I I I I I I I I I I I II I II i I I M II I I I II I II I II II M 
Db 17 99 CAGCTGTCCATGATTTGAAGCACAATCCGGAATCTGCGGCAACGCGAATGAAAACGAACA 1858 

Qy 2259 GCGAGCAGGTCTATACCCACGACGTCAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGG 2318 

I I I M I I I I I II II I II i I I I I M I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I M I 
Db 1859 GCGAGCAGGTCTATACCCACGACGTCAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGG 1918 

Qy 2319 CACAGTCGGGAGAAAACTCATGAACCGCGCACGAATCGCGACCATAGGCGTTCTTCCGCT 237 8 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1919 CGCAGTCGGGAGAAAACTCATGAACCGCGCACGAATCGCGACCATAGGCGTTCTTCCGCT 1978 



Qy 


2379 


TGCTTTACTGCTGGCGTCCTGTGGTTCAGACACCGTGGAAATGACAGATTCCACCTGGTT 


2438 




| | | | | | | | | | | ] | | | | | [ | | | | | | | | | | | | | | | | | | | | j I I 1 ! 1 1 1 1 1 1 ! 1 1 M 1 1 1 1 1 1 




Db 


1979 


TGCTTTACTGCTGGCGTCCTGTGGTTCAGACACCGTGGAAATGACAGATTCCACCTGGTT 


2038 


Qy 


24 39 


GGTGACCAAT AT TTACACCGATCCAGAT GAGT CGAAT'f CGATCAGTAATCT T GT CAT TT C 


24 98 




| | | | | | | | | | j | | ( j | | | | | | | | | | | | | | | | | | | | j | | | | | | | | | | i | I I I I I i | I I I I I 




Db 


2039 


GGTGACCAATATTTACACCGATCCAGATGAGTCGAATTCGATCAGTAATCTTGTCATTTC 


2098 


Qy 


24 99 


CCAGCCCAGCTTAGATTTTGGCAATTCTTCCCTGTCTGGTTTCACTGGCTGTGTGCCTTT 


2558 




1 1 1 I 1 1 1 1 1 1 1 M 1 1 1 1 1 I 1 I 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 I 1 1 1 1! 1 I 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 


2158 


Db 


2099 


CCAGCCCAGCTTAGATTTTGGCAATTCTTCCCTGTCTGGTTTCACTGGCTGTGTGCCTTT 


Qy 


2559 


TACGGGGCGTGCGGAATTCTTCCAAAATGGTGAGCAAAGCTCTGTTCTGGATGCCGATTA 


2618 




| j | | | | j | | | | | | | | | } | } | | | | | | | j | i | | | | | ] | | | | | I I I I 1 1 1 t I 1 1 1 1 1 1 1 1 1 1 1 




Db 


2159 


TACGGGGCGTGCGGAATTCTTCCAAAATGGTGAGCAAAGCTCTGTTCTGGATGCCGATTA 


2218 


Qy 


2619 


TGTGACCTTGTCTTCCCTGGATTTCGATAAACTTCCCGATGATTGCCAAGGACAAGAACT 


2678 




r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii t > i m i 




Db 


2219 


TGTGACCTTGTCTTCCCTGGATTTCGATAAACTTCCCGATGATTGCCAAGGACAAGAACT 


2278 


Qy 


2679 


CAAAGTTCATAACGAGCTGGTTGATCTTCTGCCTGGTTCTTTTGAAATCTCCAGGACTTC 


2738 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


2279 


CAAAGTTCATAACGAGCTGGTTGATCTTCTGCCTGGTTCTTTTGAAATCTCCAGGACTTC 


2338 


Qy 


2739 


TGGTTCAGAAATCTTGCTGACTAGCGATGTC 27 69 






i 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 Ii 1 1 1 ! I 1 1 1 1 1 




Db 


2339 


TGGTTCAGAAATCTTGCTGACTAGCGATGTC 2369 





; Sequence 1, Application US/09431099 

; Patent No. 6410705 

; GENERAL INFORMATION : 

; APPLICANT: Degussa-HOls AG 

APPLICANT: For schungs zentrum- JOlich GmbH 

TITLE OF INVENTION: New nucleotide sequences coding for the thrE gene and 
process for the 

; TITLE OF INVENTION: enzymatic production of L-threonine with coryneform 
bacteria . 

Query Match 46.7%; Score 1405.6; DB 4; Length 2817; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 1408; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 1 ATTGCGGGGCTTACTGCGCTGATGGGTTCTGCGTTTTATTACCTCTTCGTTGTTTATTTA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 06 ATTGCGGGGCTTACTGCGCTGATGGGTTCTGCGTTTTATTACCTCTTCGTTGTTTATTTA 14 65 

Qy 61 GGCCCCGTCTCTGCCGCTGCGATTGCTGCAACAGCAGTTGGTTTCACTGGTGGTTTGCTT 120 

I I I I I I M II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 66 GGCCCCGTCTCTGCCGCTGCGATTGCTGCAACAGCAGTTGGTTTCACTGGTGGTTTGCTT 1525 

Qy 121 GCCCGTCGATTCTTGATTCCACCGTTGATTGTGGCGATTGCCGGCATCACACCAATGCTT 18 0 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I i I I I I I I I I I I I 
Db 1526 GCCCGTCGATTCTTGATTCCACCGTTGATTGTGGCGATTGCCGGCATCACACCAATGCTT 1585 

Qy 181 CCAGGTCTAGCAATTTACCGCGGAATGTACGCCACCCTGAATGATCAAACACTCATGGGT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 15 8 6 CCAGGTCTAGCAATTTACCGCGGAATGTACGCCACGTTGAATGATCAAACACTCATGGGT 164 5 

Qy 241 TTCACCAACATTGCGGTTGCTTTAGCCACTGCTTCATCACTTGCCGCTGGCGTGGTTTTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 164 6 TTCACCAACATTGCGGTTGCTTTAGCCACTGCTTCATCACTTGCCGCTGGCGTGGTTTTG 17 05 

Qy 301 GGTGAGTGGATTGCCCGCAGGCTACGTCGTCCACCACGCTTCAACCCATACCGTGCATTT 360 

I I I II I I II I I I I I I I I I I I I I I I II I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 1706 GGTGAGTGGATTGCCCGCAGGCTACGTCGTCCACCACGCTTCAACCCATACCGTGCATTT 17 65 

Qy 3 61 ACCAAGGCGAATGAGTTCTCCTTCCAGGAGGAAGCTGAGCAGAATCAGCGCCGGCAGAGA 4 20 

I I I I I I I I I I M II I I I I I I I I I II M I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 

Db 17 66 ACCAAGGCGAATGAGTTCTCCTTCCAGGAGGAAGCTGAGCAGAATCAGCGCCGGCAGAGA 182 5 

Qy 4 21 AAACGTCCAAAGACTAATCAGAGATTCGGTAATAAAAGGTAAAAATCAACCTGCTTAGGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I 

Db 182 6 AAACGTCCAAAGACTAATCAAAGATTCGGTAATAAAAGGTAAAAATCAACCTGCTTAGGC 18 8 5 

Qy 4 81 GTCTTTCGCTTAAATAGCGTAGAATATCGGGTCGATCGCTTTTAAACACTCAGGAGGATC 54 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 1 1 1 1 1 I 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 

Db 1886 GTCTTTCGCTTAAATAGCGTAGAATATCGGGTCGATCGCTTTTAAACACTCAGGAGGATC 1945 

Qy 541 CTTGCCGGCCAAAATCACGGACACTCGTCCCACCCCAGAATCCCTTCACGCTGTTGAAGA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 194 6 CTTGCCGGCCAAAATCACGGACACTCGTCCCACCCCAGAATCCCTTCACGCTGTTGAAGA 2005 



Qy 

Db 



601 GGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTATTCTAAGGACTTCTTCGACGG 660 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 006 GGAAACCGCAGCCGGTGCCCGCAGGATTGTTGCCACCTATTCTAAGGACTTCTTCGACGG 20 65 



6 61 CGTCACTTTGATGTGCATGCTCGGCGTTGAACCTCAGGGCCTGCGTTACACCAAGGTCGC 7 20 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 M I 

2 06 6 CGTCACTTTGATGTGCATGCTCGGCGTTGAACCTCAGGGCCTGCGTTACACCAAGGTCGC 212 5 

721 TTCTGAACACGAGGAAGCTCAGCCAAAGAAGGCTACAAAGCGGACTCGTAAGGCACCAGC 78 0 

I I II I I II I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

212 6 TTCTGAACACGAGGAAGCTCAGCCAAAGAAGGCTACAAAGCGGACTCGTAAGGCACCAGC 2185 

781 TAAGAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCACTAAGAAAACTACTAAAAAGAC 84 0 

I I I I I I I I I I I I M I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

218 6 T AAG AAG G C TGC T GC T AAGAAAAC GACC AAG AAG AC C AC T AAGAAAAC T AC T AAAAAGAC 22 4 5 

841 CACCGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGATCTTATATGGATGATTCCAATAG 900 
I! I I I I I I I I I I I I I I I II I I I i I ! I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I E 

224 6 CACCGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGATCTTATATGGATGATTCCAATAG 2305 

901 CTTTGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGACTGTCCACCCAGATGGTAGCTA 9 60 
I I I I I I I I I I I I I II I I 1 I I II I I I I I I I II I II I I I II I I I I I I I I I I I I I II I I I II I 
2 30 6 CTTTGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGACTGTCCACCCAGATGGTAGCTA 2365 

961 TAGCATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACA 102 0 

I II M I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I 

2 3 6 6 TAGCATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACA 2 4 25 
1021 TCGTGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAAC 10 8 0 

I I I I II I I I I M I I I I I I M I I I I I II I I I I M I I II I I I I I II I I I I I I I I I I I I I I I I 

2 4 2 6 TCGTGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAAC 24 8 5 

1081 AGATACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I 

2 4 8 6 AGATACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTA 25 4 5 

1141 CGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCCACGATCTGATTGTTACTCCGGT 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 

254 6 CGAGGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCCACGATTTGATTGTTACTCCGGT 2605 

1201 GTACT^ACACCGATTGGTGGCATGCGTTTCGGGAGGTAAACCTCAAGTTCGCTGAAGCCGT 12 60 
I I I I I I M I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I ! I E I 

2 60 6 GTACAACACCGATTGGTGGCATGCGTTTCGGGAAGTAAACCTCAAGTTCGCTGAAGCCGT 2 6 65 

12 61 GAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTATCAGCTGTTGCTGGT 1320 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I M I I I I I I I I I II I I I I I I I I I 

2 66 6 GAGCCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTATCAGCTGTTGCTGGT 27 25 

1321 TCCTGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCC 138 0 

I I II I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I 1 I II II I I I I I I I I M I I I I 

272 6 TCCTGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCC 2785 

1381 CTTCCCTTCCCCTGATCTGTTCCGTCAGCTGC 14 12 

I I I I I I II II I I I I II I I I I I I I I I I I I I I I I 
278 6 CTTCCCTTCCCCTGATCTGTTCCGTCAGCTGC 2817 



AX063735 
LOCUS 

DEFINITION 
ACCESSION 
VERSION 
SOURCE 

ORGANISM 



AUTHORS 
TITLE 

JOURNAL 



AX063735 1578 bp DNA linear PAT 24-JAN-2001 

Sequence 17 from Patent WO0100843. 

AX063735 

AX063735.1 GI:12541447 
Corynebacterium glutamicum 
Corynebacterium glutamicum 

Bacteria; Act inobacteria ; Actinobacteridae; Actinomycetales ; 
Corynebacterineae ; Corynebacteriaceae ; Corynebacterium. 
Pompejus,M., Kroeger,B., Schroeder , H . , Zelder,0. and Haberhauer , G . 
corynebacterium glutamicum genes encoding metabolic pathway 
proteins 

Patent: WO 0100843-A 17 04-JAN-2001; 



Query Match 52.4%; Score 1578; DB 6; Length 1578; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1578; Conservative 0; Mismatches 0; Indels 0; 



Gaps 



0; 



Qy 

Db 


784 
1 


GAAGGCTGCTGCTAAGAAAACGACCAAGAAGACCACTAAGAAAACTACTAAAAAGACCAC 
1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GAAG GC T GC T GC TAAG AAAACGAC CAAG AAG AC C AC T AAG AAAAC T AC T AAAAAG ACCAC 


843 
60 


Qy 


844 


CGCAAAGAAGACCACAAAGAAGTCTTAAGCCGGATCTTATATGGATGATTCCAATAGCTT 
1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 hi 1 I 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 
C GC AAAG AAG AC CAC AAAG AAG T C T TAAG C C G G AT C T TAT AT GG AT GAT T CCAAT AGC T T 


903 


Db 


61 


120 


Qy 


c\r\ a 

y U4 


TGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGACTGTCCACCCAGATGGTAGCTATAG 

M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 M II II 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1- 1 1 1 1 1 

TGTAGTTGTTGCTAACCGTCTGCCAGTGGATATGACTGTCCACCCAGATGGTAGCTATAG 


963 


Db 


121 


180 


Qy 


964 


CATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACATCG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 

CATCTCCCCCAGCCCCGGTGGCCTTGTCACGGGGCTTTCCCCCGTTCTGGAACAACATCG 


1023 


Db 


181 


240 


Qy 


1024 


TGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAACAGA 
1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 i 1 1 1 1 1 II 1 1 1 1 II 1 11 1 1 II 1 I 1 1 1 1 1 1 1 1 
TGGATGTTGGGTCGGATGGCCTGGAACTGTAGATGTTGCACCCGAACCATTTCGAACAGA 


1083 


Db 


241 


300 


Qy 


108 4 


TACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTACGA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

TACGGGTGTTTTGCTGCACCCTGTTGTCCTCACTGCAAGTGACTATGAAGGCTTCTACGA 


1143 


Db 


301 


360 


Qy 


1144 


GGGCTTTTCTVAACGCAACGCTGTGGCCTCTTTTCCACGATCTGATTGTTACTCCGGTGTA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 II 1 1 1 1 1 1 1 I I 1 I I I | | | | || | | | | | | || | | | | | 

GGGCTTTTCAAACGCAACGCTGTGGCCTCTTTTCCACGATCTGATTGTTACTCCGGTGTA 


1203 


Db 


361 


420 


Qy 


1204 


CAACACCGATTGGTGGCATGCGTTTCGGGAGGTAAACCTCAAGTTCGCTGAAGCCGTGAG 
1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 

CAACACCGATTGGTGGCATGCGTTTCGGGAGGTAAACCTCAAGTTCGCTGAAGCCGTGAG 


1263 


Db 


421 


480 


Qy 


1264 


CCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTATCAGCTGTTGCTGGTTCC 
1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCAAGTGGCGGCACACGGTGCCACTGTGTGGGTGCAGGACTATCAGCTGTTGCTGGTTCC 


1323 


Db 


481 


540 



Qy 

Db 



132 4 TGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCCCTT 138 3 

INI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 TGGCATTTTGCGCCAGATGCGCCCTGATTTGAAGATCGGTTTCTTCCTCCACATTCCCTT 600 



138 4 CCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGCGTGAAGAGATTGTTCGAGGCATGCT 14 4 3 

1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i ii i 1 1 1 1 1 1 m 1 1 

601 CCCTTCCCCTGATCTGTTCCGTCAGCTGCCGTGGCGTGAAGAGATTGTTCGAGGCATGCT 6 60 

1444 GGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAAACGCAGAAAACTTCCTTGCGTTAAC 1503 
I I I I II I I I I 1 I I I I II I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 

661 GGGCGCAGATTTGGTGGGATTCCATTTGGTTCAAAACGCAGAAAACTTCCTTGCGTTAAC 7 20 

1504 CCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGGGTCAGCCGGACACCTTGCAGGTCAG 15 63 

I I M I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 21 CCAGCAGGTTGCCGGCACTGCCGGGTCTCATGTGGGTCAGCCGGACACCTTGCAGGTCAG 7 8 0 

1564 TGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATGTTGAAACCGCTGACGGAAGGCGAGT 1623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 81 TGGTGAAGCATTGGTGCGTGAGATTGGCGCTCATGTTGAAACCGCTGACGGAAGGCGAGT 8 4 0 

162 4 TAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTGAAATGTTTGGGGAGGCGTCGAAAAG 168 3 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

841 TAGCGTCGGGGCGTTCCCGATCTCGATTGATGTTGAAATGTTTGGGGAGGCGTCGAAAAG 900 

168 4 CGCCGTTCTTGATCTTTTAAAAACGCTCGACGAGCCGGAAACCGTATTCCTGGGCGTTGA 17 4 3 

I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

901 CGCCGTTCTTGATCTTTT7\AAAACGCTCGACGAGCCGGAAACCGTATTCCTGGGCGTTGA 9 60 

17 4 4 CCGACTGGACTACACCAAGGGCATTTTGCAGCGCCTGCTTGCGTTTGAGGAACTGCTGGA 1803 

I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 CCGACTGGACTACACCAAGGGCATTTTGCAGCGCCTGCTTGCGTTTGAGGAACTGCTGGA 102 0 

18 0 4 ATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGCTGCAGGTCGCGACGCCTTCGCGTGA 18 63 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 ATCCGGCGCGTTGGAGGCCGACAAAGCTGTGTTGCTGCAGGTCGCGACGCCTTCGCGTGA 1080 

18 64 GCGCATTGATCACTATCGTGTGTCGCGTTCGCAGGTCGAGGAAGCCGTCGGCCGTATCAA 1923 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 GCGCATTGATCACTATCGTGTGTCGCGTTCGCAGGTCGAGGAAGCCGTCGGCCGTATCAA 114 0 

192 4 TGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGCATTATCTACACAGGTCATTGAGCAA. 198 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
1141 TGGTCGTTTCGGTCGCATGGGGCGTCCCGTGGTGCATTATCTACACAGGTCATTGAGCAA 12 00 

198 4 AAATGATCTCCAGGTGCTGTATACCGCAGCCGATGTCATGCTGGTTACGCCTTTTAAAGA 204 3 

I I I I I I I I I I I I I I I I I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 01 AAATGATCTCCAGGTGCTGTATACCGCAGCCGATGTCATGCTGGTTACGCCTTTTAAAGA 12 60 

2 04 4 CGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCAACCACCGCGACGGCACTGGTGCTTT 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

12 61 CGGTATGAACTTGGTGGCTAAAGAATTCGTGGCCAACCACCGCGACGGCACTGGTGCTTT 132 0 

2104 GGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGCTGACCGGTGCGTATTTATGCAACCC 2163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I 

1321 GGTGCTGTCCGAATTTGCCGGCGCGGCCACTGAGCTGACCGGTGCGTATTTATGCAACCC 13 8 0 

2164 ATTTGATGTGGAATCCATCAAACGGCA7\ATGGTGGCAGCTGTCCATGATTTGAAGCAC7\A 2223 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1381 ATTTGATGTGGAATCCATCAAACGGCAAATGGTGGCAGCTGTCCATGATTTGAAGCACAA 14 4 0 



222 4 TCCGG7\ATCTGCGGGAACGCGAATGAAAACGAACAGCGAGCAGGTCTATACCCACGACGT 2283 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 
1441 TCCGGAATCTGCGGCAACGCGAATGAAAACGAACAGCGAGCAGGTCTATACCCACGACGT 1500 

228 4 CAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGGCACAGTCGGGAGAAAACTCATGi\AC 234 3 

I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CAACGTGTGGGCTAATAGTTTCCTGGATTGTTTGGCACAGTCGGGAGAAAACTCATGAAC 1560 

234 4 CGCGCACGAATCGCGACC 2 361 

I I I I I I I I I I I i I I I I I I 

1561 CGCGCACGAATCGCGACC 157 8 



